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摘要 : [ 目的 /意义 ] 对 知识 网 络 中 结构 关系 的 有 效 识 别 与 提取 ,有 助 于 从 纷繁 的 数据 中 探测 知识 网 络 的 拓 
扑 结构 及 其 演化 模式 。[ 方 法 /过 程 ] 本文 提出 一 种 基于 邻接 矩阵 特征 分 解 的 知识 网 络 结 构 关系 提取 方法 。 基 
于 真实 数据 分 别 从 静态 结构 关系 提取 和 动态 结构 演化 两 个 方面 ,对 特征 分 解法 和 传统 关联 频 度 法 进行 对 比分 
析 , 并 与 Pathfinder 算法 进行 对 比 。 对 基于 特征 分 解法 提取 知识 网 络 结构 关系 的 有 效 性 进行 验证 。[ 结果 / 结 
论 ] 研 究 结 果 表 明 :特征 分 解法 能 够 识别 原始 知识 网 络 中 的 主要 成 分 信息 ,能 够 准确 识别 低频 次 的 对 网 络 整 体 


拓扑 结构 较为 重要 的 关联 关系 , 且 提 取 方 法 灵活 自由 。 


关键 词 : 知识 网 络 ”特征 网 络 特征 分 解 
S 分 类 号 : 6255.76 
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二 知识 网 络 分 析 方 法 已 经 成 为 图 书 情报 领域 的 一 
种 探究 知识 单元 之 间 关 联 关系 与 结构 模式 的 新 型 研 
Jtt. 研究 人 员 以 关键 词 .专利 技术 等 知识 单元 
伦 湖 网 络 节点 ,以 知识 单元 之 间 的 关联 关系 作为 边 ， 
构建 关键 词 网 络 .专利 网 络 等 知识 网 络 。 通 过 分 析 
知 溪 网 络 的 统计 特征 及 拓扑 结构 ,可 以 研究 知识 的 
层 奶 结构 与 演化 机 制 等 问题 。 随 着 大 数据 分 析 思 想 
在 车 学 研究 中 的 应 用 ,知识 网 络 研究 中 的 数据 规模 
斋 关 与 多 样 性 等 特征 纷纷 得 以 体现 。 但 是 在 知识 网 
络 研究 关注 数据 分 析 的 高 价值 的 同时 ,不 得 不 面 对 
大 数据 分 析 中 的 低 价值 密度 问题 。 因 此 ,在 保障 数 
据 信息 高 频 显著 性 的 同时 ,提取 知识 网 络 的 有 效 结 
构 关系 ,成 为 知识 网 络 分 析 中 一 个 亟 需 解决 的 问 
题 。 

针对 传统 关联 频 度 等 方法 在 提取 网 络 信息 方面 的 
不 足 , 本 文 提出 一 种 兼顾 网 络 关联 频 度 与 拓扑 信息 的 
知识 网 络 结构 关系 提取 方法 ,并 分 别 通过 静态 与 动态 
的 知识 网 络 结构 关系 提取 , 对 该 方法 的 有 效 性 进行 
验证 。 


2 相关 研究 工作 


随 着 20 世纪 末 网 络 科 学 (Network Science)  JL4* 
重要 研究 成 果 的 发 表 , 网络 分 析 作 为 一 种 新 的 研究 范 
式 越 来 越 受到 学 术 界 的 重视 。 网 络 思 维 尤 其 适用 于 针 
对 复杂 系统 中 的 组 成 元 素 及 其 关联 关系 进行 描述 和 分 
析 , 即 将 系统 组 成 元 素 抽象 为 网 络 节点 ,将 元 素 之 间 的 
关联 关系 抽象 为 网 络 的 边 。 网 络 作为 对 这 些 复杂 系统 
的 一 般 抽象 和 描述 方式 ,突出 强调 了 复杂 系统 的 拓扑 
结构 与 统计 特征 。 网 络 科 学 与 图 书 情报 学 的 结合 也 
改变 了 图 书 情报 学 传统 的 基于 描述 统计 的 研究 范式 。 
研究 人 员 在 专利 分 析 ”、 引 文 分 析 “、 热 点 判 识 ”、 知 
识 涌现 ” ,重要 学 者 识别 ”知识 网 络 结构 ”等 领域 引 
人 网 络 分 析 理 论 ,更 好 地 揭示 了 研究 对 象 的 结构 关系 。 
J. Liebowitz ”指出 ,网 络 分 析 手 段 有 助 于 更 好 地 解释 
知识 之 间 的 关联 关系 和 知识 的 层级 结构 ,在 知识 管理 
中 的 作用 日 益 突 出 。 

在 研究 工作 以 数据 为 基础 进行 分 析 和 挖掘 的 同 
时 , 随 着 数量 的 增加 ,人 研究 工作 必须 面 对 大 数据 分 析 中 
价值 密度 低 的 问题 。 早 期 的 节点 频次 法 是 首先 选取 领 
域 中 高 频 出 现 的 知识 单元 (如 关键 词 ) 作为 网 络 节 点 ， 
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RF, 滕 广 青 , 安宁 , 等 .基于 特征 分 解 的 知识 网 络 结 构 关 系 提取 [本 .图 书 情报 工作 ,2019 ,63(7) :96 - 104. 


然后 建立 节点 之 间 的 关联 关系 。 该 方法 强调 知识 
单元 (节点 ) 个 体 的 高 频 性 ,但 是 对 知识 关联 关系 的 重 
视 程度 不 足 。 目 前 采用 较 多 的 方法 是 关联 频 度 法 , 首 
先 选 取 高 频次 的 关联 关系 (节点 对 ) ,基于 高 频 关联 关 
系 提取 建立 知识 网 络 。 满 足 特定 关联 频 度 的 知识 网 络 
相 比 节点 频次 法 凸显 了 网 络 分 析 中 关联 关系 的 重要 
性 。 这 种 提取 网 络 信 息 的 方法 简单 直观 且 计算 任务 
少 ,被 广泛 应 用 于 图 书 情报 研究 领域 ,在 关联 主题 提 
WU 、 知 识 网 络 结构 识别 ”等 相关 研究 中 取得 了 相应 
的 成 果 。 学 术 界 将 这 些 基于 一 定 关联 频 度 水 平 提取 的 
知识 网 络 称 为 水 平 网 络 或 层次 网 络 ( Network. at Lev- 
el) [13] ` 

在 对 网 络 进行 简化 方面 ,除了 基于 节点 关联 频 度 
的 提取 方法 外 ,还 有 一 类 以 Pathfinder 算法 ”为 代表 
的 本 于 网 络 路 径 的 提取 方法 。Pathfinder 算法 中 ,如 果 
两 节点 之 间 的 距离 D 小 于 直接 连接 两 个 节点 的 边 的 
模 晤 , 则 将 这 条 边 从 网 络 剔除 。 因 此 Pathfinder 算法 的 
所 要 思想 是 通过 计算 节点 之 间 不 同 路 径 的 权重 ,来 比 
畔 类 断 节点 之 间 直 接 相连 的 边 的 重要 程度 。 该 算法 在 
知 耿 网 络 路 径 研究 和 简化 分 析 中 最 典型 的 应 用 是 文献 
D. IT CiteSpace, [itl 36 ^ 将 Pathfinder 算法 引入 
ERARIK AAE f BI Pathfinder 算法 的 完备 性 ,在 
简化 网 络 的 同时 突出 重要 的 链 路 特征 。 由 于 Pathfind- 
er 迁 法 在 主 路 径 识别 方面 的 独特 性 ,该 方法 在 社区 
AAAA .成 员 结构 9、 知识 交流 路 径 "”、 关 键 文 
ARI 等 方面 也 被 广泛 应 用 。 
“三 随 着 网 络 科学 研究 在 网 络 拓扑 结构 方面 成 果 的 发 
布 固 积 累 ,上 述 曾经 得 到 学 术 界 认可 的 关联 频 度 法 和 
Pathfinder 算法 等 ,在 突出 关联 关系 频 度 或 链 路 重要 性 
的 同时 ,也 在 一 些 针对 特定 问题 的 网 络 拓扑 结构 信息 
的 提取 方面 显露 出 不 足 之 处 ,可 能 会 使 研究 工作 遗漏 
网 络 的 重要 拓扑 结构 信息 。 鉴 于 此 ,本 文 提出 一 种 基 
于 邻接 矩阵 特征 分 解 的 知识 网 络 结构 关系 提取 方法 ， 
以 期 在 生成 的 知识 网 络 中 兼顾 关联 频 度 与 重要 拓扑 结 
构 信息 。 


3 理论 与 方法 


3.1 知识 网 络 结构 关系 的 相关 理论 

知识 单元 一 般 被 认为 是 领域 知识 的 最 小 单位 ,但 
是 单一 知识 单元 的 属性 并 不 能 表征 领域 知识 的 整体 属 
性 特征 。 正 如 《信息 简 史 》 的 作者 J， Gleick ”所 指出 
的 ,知识 之 间 的 连通 性 比 知识 单元 本 身 更 为 重要 。 领 
域内 诸多 知识 单元 个 体 基于 一 定 的 关联 关系 形成 知识 


网 络 宏观 上 的 结构 模式 ,这 恰恰 是 针对 复杂 系统 研究 
所 遵循 的 主要 视角 。 知 识 网 络 研究 正 是 基于 网 络 思维 
对 知识 单元 尤其 是 知识 关联 关系 进行 考查 。 大 量 的 知 
识 网 络 研究 工作 表明 ,众多 的 知识 单元 通过 特定 的 关 
联 关系 聚集 在 一 起 ,形成 特定 的 拓扑 结构 特征 ,进而 涌 
现 出 知识 网 络 宏观 层面 的 模式 与 规律 。 

提取 知识 网 络 结构 关系 的 传统 方法 主要 是 节点 频 
次 法 .关联 频 度 法 和 Pathfinder 算法 。 节 点 频次 法 将 单 
一 知识 单元 (网 络 节点 ) 的 重要 性 放 在 了 首位 。 李 网 
等 ”指出 ,用 高 频 词 代表 领域 整体 的 研究 方向 存在 着 
天 然 的 缺陷 ,而 低频 词 有 助 于 获取 一 些 隐 含 主题 或 前 
瞻 主 题 的 信息 。 而 关联 频 度 法 在 获得 关联 频 度 阔 值 水 
平 (层次 ) 上 的 知识 网 络 过 程 中 ,对 关联 频 度 的 考查 仅 
限于 关系 (节点 对 ) 个 体 , 没 能 兼顾 整体 网 络 的 拓扑 结 
构 , 也 可 能 在 一 定 程度 上 忽视 或 遗漏 重要 的 低频 度 知 
识 关联 。Pathfinder 算法 只 能 在 节点 之 间 存 在 路 径 权 
重 较 低 的 路 径 的 前 提 下 剔除 节点 之 间 的 连 边 ,因此 
Pathfinder 算法 的 计算 结果 是 一 个 连通 的 网 络 , 原 始 网 
络 中 的 节点 规模 并 不 会 得 到 精简 。 在 知识 网 络 研 究 
中 ,知识 节点 (如 关键 词 ) 之 间 的 关联 频 度 只 是 知识 网 
络 的 局 部 信息 。 判 断 知识 节点 及 其 关联 关系 的 重要 程 
度 ,不 仅 要 参考 知识 节点 及 其 关联 关系 的 局 部 信息 ,还 
要 从 网 络 整体 拓扑 结构 上 对 其 加 以 考量 。 在 领域 知识 
演化 发 展 的 过 程 中 ,即使 低频 度 的 关联 关系 (节点 对 ) 
有 时 也 扮演 着 非常 重要 的 角色 。 

邻接 抢 阵 是 知识 网 络 的 数学 表达 。 对 邻接 矩阵 进 
行 特征 分 解 ,能 够 在 关注 知识 单元 与 知识 关联 的 局 部 
属性 同时 ,兼顾 知识 网 络 拓扑 结构 的 整体 属性 。 因 此 ， 
本 文 提 出 基于 邻接 矩阵 特征 分 解 的 知识 网 络 结构 关系 
信息 提取 方法 。 特 征 分 解 (eigen decomposition ) 指 的 是 
将 一 个 矩阵 分 解 为 由 其 特征 值 和 特征 向 量 表示 的 矩阵 
之 积 。 原 始 知识 网 络 G(N,L) 的 邻接 矩阵 A 是 一 个 实 
对 称 方 阵 , 因 此 能 够 对 其 实施 特征 分 解 。 和 抢 阵 可 以 被 
理解 为 在 其 线性 空间 下 的 一 种 线性 变换 的 描述 。 通 
过 特征 分 解 ,能 够 发 现 矩阵 的 特征 值 及 特征 向 量 ,由 
此 推导 得 出 矩阵 所 描述 的 变换 形式 ,并 提取 矩阵 的 
主要 特征 值 所 对 应 的 结构 关系 信息 。 邻 接 和 矩阵 A 承 
载 了 原始 知识 网 络 G 的 全 部 连接 信息 ,其 中 元 素 的 
值 是 知识 节点 之 间 的 关联 频次 ,特征 值 在 网 络 中 有 
对 应 的 拓扑 结构 信息 。 提 取 和 邻接 矩阵 A 的 主要 特征 
值 , 相 当 于 融入 PageRank ”算法 思想 后 提取 网 络 G 
的 拓扑 结构 信息 。 据 此 可 以 组 合生 成 研究 工作 需要 
的 特征 网 络 。 
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3.2 方法 与 流程 

基于 真实 数据 构建 的 邻接 和 矩阵 A 是 一 个 多 值 矩 
阵 。 和 矩阵 中 的 元 素 值 表示 知识 节点 之 间 的 关联 频次 。 
对 于 邻接 矩阵 A, 如 果 元 素数 值 为 0, 则 相对 应 的 知识 
节点 之 间 不 存在 关联 关系 ;如 果 元 素 值 大 于 0, 则 相对 
应 的 知识 节点 之 间 存 在 关联 关系 。 对 于 一 个 N*N 的 
邻接 矩阵 A, 它 有 N 个 实 特征 值 ,降序 排列 记 作 ACi 
1,2,3, 0, N) ,同时 对 应 有 AN 个 线性 无 关 的 特征 
量 , 记 作 qi=1,2, 3,，…,N)。 对 邻接 矩阵 A XE 
特征 分 解 ,得 到 : 


Com 


A - QAQ" 

其 中 ,Q 是 由 特征 向 量 组 成 的 正 交 和 矩阵 ,Q 的 第 i 
列 等 于 97,A 是 对 角 线 元 素 为 降序 排列 的 特征 值 Ai(i 
= ,3,…,N) 的 对 角 矩 阵 。 
,之 与 此 同时 ,对 邻接 矩阵 A 进行 二 值 化 处 理 ,得 到 二 
DRE C, 用 于 判断 知识 节点 间 关联 关系 的 存在 性 。 
MULA EE XUI T E RE FC AE BOR E A 的 主要 
ATJE SCOPE EE HORE ft D A 中 除 需 要 保留 特征 
值 之 外 的 其 他 特征 值 赋值 为 0 得 到 4*, 由 此 构建 矩阵 


B - QA, Q” 
OEE B 是 对 邻接 矩阵 A 的 信息 的 提取 ,其 中 包含 
ATA BER IE A 的 特定 的 特征 值 及 其 特征 向 量 所 对 应 的 
ARSA Eo EREB 中 的 元 素 的 值 是 相对 于 特定 的 特征 
值 线 合 下 网 络 边 的 权重 。 影 响 矩 阵 B 中 元 素 值 的 因素 
有 晴 个 :一 是 知识 节点 之 间 的 关联 频次 ;二 是 特定 的 特 
征 荔 所 对 应 的 网 络 拓扑 结构 信息 。 进 一 步 将 矩阵 B 与 
BUS IE C 进行 对 照 ,如 果 二 值 矩阵 C 中 某 关联 关系 
不 存在 , 则 对 矩阵 B 进行 修正 ,将 对 应 的 边 权 重修 正 为 
0。 修 正 后 的 矩阵 B 对 应 的 知识 网 络 的 拓扑 结构 与 原 
始 知识 网 络 一 致 ,只 是 此 时 知识 网 络 的 边 权重 被 重新 
赋值 。 与 传统 关联 频 度 法 中 的 固定 权重 不 同 ,特征 分 
解法 中 边 的 权重 是 一 种 动态 权重 ,具有 相对 性 。 选 定 
的 特征 值 不 同 ,所 提取 的 拓扑 结构 信息 不 同 , 网 络 中 每 
一 条 边 的 权重 的 值 都 会 相对 产生 变化 。 这 样 定义 的 边 
的 权重 兼顾 了 网 络 的 局 部 信息 和 整体 拓扑 结构 信息 。 

接 下 来 ,根据 边 的 权重 设 定 阔 值 , 舍 弃 重新 赋值 的 
知识 网 络 中 权重 低 于 阔 值 的 边 ,并 剔除 孤立 节点 ,生成 
特征 网 络 下 ,至 此 完成 对 知识 网 络 结构 关系 信息 的 提 
取 。 整 个 流程 见 图 1。 

需要 注意 的 是 ,基于 真实 数据 而 构建 的 邻接 矩阵 
A 往往 比较 稀 朴 ,这 使 得 邻接 矩阵 A 中 存在 少量 数值 
较 大 的 特征 值 和 大 量 数值 较 小 的 特征 值 。 因 此 只 需 少 
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剔除 孤立 市 点 


TEE PIA E 


结束 


图 1 特征 分 解法 提取 网 络 结构 关系 流程 


量 的 特征 值 及 特征 向 量 组 合 即 可 描述 邻接 矩阵 A 的 主 
要 变换 内 容 。 对 于 原始 知识 网 络 G 而 言 ,这 些 少量 的 
特征 值 及 特征 向 量 对 应 了 网 络 的 重要 拓扑 结构 。 特 征 
值 的 选取 决定 了 网 络 中 哪些 拓扑 结构 信息 将 被 提取 出 
来 ,可 以 选取 任意 序 位 的 一 个 或 多 个 连续 的 或 不 连续 
的 特征 值 。 此 外 ,将 矩阵 B 中 的 元 素 值 作为 边 的 权重 
赋值 给 原始 知识 网 络 G 的 边 集合 工 , 而 边 权 重 的 阔 值 
有 于 判定 和 提取 相对 于 已 选 定 的 拓扑 结构 而 言 重要 程 
度 较 高 的 边 。 特 征 值 选取 决定 了 网 络 中 被 提取 的 拓扑 
结构 信息 , 边 权重 闷 值 则 决定 了 最 终 提取 得 到 的 特征 
网 络 的 规模 。 如 果 需 要 提取 较 多 的 网 络 信息 ,可 以 增 
加 特征 值 数量 ,适当 降低 权重 阔 值 ;反之 则 可 以 减少 特 
征 值 数量 ,适当 升 高 权重 闵 值 。 在 特征 分 解法 中 ,被 选 
定 的 特征 值 组 合 所 对 应 的 网 络 拓扑 结构 中 的 边 的 权重 
得 到 提升 ,其 他 边 的 权重 则 相对 降低 ,从 而 能 够 根据 不 
同 的 关注 重点 突出 网 络 局 部 结构 的 重要 程度 。 正 因为 
这 一 特性 ,特征 分 解法 不 仅 可 以 从 整体 上 对 网 络 进行 
简化 ,还 能 够 识别 、 提 取 网 络 中 的 重要 局 部 信息 。 
3.3 特征 分 解法 与 关联 频 度 法 

在 以 往 利 用 关联 频 度 法 的 研究 中 , 靖 值 的 设 定 往 
往 需 要 依赖 于 研究 者 的 个 人 经 验 , 阔 值 的 选取 局 限于 
正 整数 域 。 反 映 在 对 邻接 矩阵 A 的 操作 上 , 则 是 将 矩 
阵 A 中 低 于 立 值 的 元 素 重 新 赋值 为 0。 深入 对 比分 析 
特征 分 解法 与 关联 频 度 法 提取 网 络 信息 的 过 程 , 可 以 
发 现 关 联 频 度 法 实际 上 是 特征 分 解法 的 一 个 特例 。 在 
寺 征 分 解法 中 , 当 和 矩阵 A 的 全 部 特征 值 都 被 保留 时 ， 
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A, 等 于 A JERE B 与 矩阵 A 相等 。 如 果 将 边 的 权 
重 阔 值 设 为 与 关联 频 度 阔 值 相同 的 正 整数 , 则 特征 分 
解法 的 返回 结果 与 关联 频 度 法 相同 ,此 时 两 种 提取 方 
法 是 在 以 一 个 相同 阔 值 对 同一 矩阵 A 进行 操作 。 

很 明显 ,关联 频 度 法 就 是 选取 邻接 矩阵 的 全 部 特 
征 值 ,并 将 边 的 权重 局 限于 正 整数 域 的 特征 分 解法 。 
从 特征 分 解 的 角度 看 ,关联 频 度 法 基于 网 络 的 全 局 视 
ft ,选取 邻接 矩阵 的 全 部 特征 值 ,以 正 整数 阔 值 对 网 络 
进行 简化 ,是 科学 合理 的 。 但 是 ,关联 频 度 法 作为 特征 
分 解法 的 一 个 特例 ,忽视 了 真实 世界 中 网 络 的 邻接 抵 
阵 的 稀 玖 性 问题 ,无 差别 地 选取 全 部 特征 值 , 是 无 法 识 
别 . 提 取 特 定 的 局 部 网 络 信息 成 分 的 。 同 时 ,关联 频 度 
法 的 阔 值 被 天 然 地 局 限于 正 整 数 域 。 关 联 频 度 法 只 能 
在 病 值 2 的 水 平 上 提取 最 多 的 网 络 信息 ,这 显然 不 利 
十 研究 人 员 对 知识 网 络 进行 深入 分 析 。 特 征 分 解法 则 
是 关联 频 度 法 的 一 般 性 扩展 。 特 征 分 解法 突破 了 关联 
法 在 特征 值 和 阔 值 选取 上 的 局 限 性 ,能 够 更 为 灵 
E 确 地 提取 网 络 信息 。 

4 以 9 研究 数据 

O 〇 研究 中 的 数据 采集 自 中 国 知 网 ( CNKI) 和 万 方 数 
IECWANFANG DATA) 知 识 服务 平台 。 以 “知识 管理 ” 
为 种 索 主题 ,以 图 书 情报 为 学 科 领 域 ,检索 1999 -2017 
BRR T- CSSCI 期 刊 的 全 部 论文 ,提取 论文 题目 . 关 
键 祝 发 表 时 间 等 相关 信息 。 为 了 从 不 同 知识 群落 之 
闻 美 联 关系 的 角度 更 好 地 对 知识 结构 关系 提取 方法 进 
行 梧 较 分 析 , 进 一 步 以 “社会 网 络 "“ 复 杂 网 络 ”“ 社 会 
网 络 分 析 ”“ 网 络 分 析 ”" 和 “网 络 科学 "为 检索 关键 词 ， 
在 中 国 知 网 中 以 “自然 科学 理论 与 方法 “社会 科学 理 
论 与 方法 “数学 "和 “ 非 线性 科学 与 系统 科学 ”为 学 科 
领域 ,在 万 方 数据 中 以 “自然 科学 总 论 "“ 社 会 科学 总 
论 " 和 “数理 科学 和 化 学 "为 学 科 领 域 ,检索 1999 - 
2017 年 间 发 表 于 CSSCI 期 刊 的 全 部 论文 ,提取 论文 题 
目 .关键 词 和 发 表 时 间 等 信息 。 汇 总 上 述 检索 所 采集 
的 全 部 数据 ,剔除 重复 论文 .会 议 通知 ,期刊 公告 等 无 
效 数据 ,最 终 得 到 期 刊 论文 合计 1 842 篇 ,关键 词 合计 
3 018 个 。 从 1999 - 2001 年 度 起 ,以 3 年 作为 一 个 时 
间 窗 口 ,以 1 年 作为 步 长 ,平滑 移动 至 2015 - 2017 年 
度 , 得 到 17 个 时 间 窗口 的 相关 基础 统计 数据 , 见 表 1。 

考虑 到 领域 知识 网 络 的 时 间 序 列 分 析 中 ,当期 发 
生 值 与 累计 值 所 反映 的 侧重 点 之 间 的 差异 性 ,以 及 本 
研究 对 知识 关联 关系 生长 与 消退 的 重点 关注 , 表 1 中 


表 1 各 时 间 窗 口 下 论文 及 关键 词 数量 


时 间 窗 口 ”论文 篇 数 ”关键 词 个 数 || 时 间 窗 口 ”论文 篇 数 ”关键 词 个 数 

u 56 126 uo 419 865 
2 112 202 ul 400 852 
[E 162 267 u2 395 839 
4 227 376 t13 388 899 
5 273 498 t14 371 917 
16 319 617 u5 342 919 
y 367 725 u6 313 838 
i8 410 822 u7 267 748 
9 436 873 


的 数据 为 各 个 时 间 窗 口 (3 年 ) 的 当期 发 生 值 。 同 时 ， 
为 了 避免 数据 剧烈 波动 对 领域 知识 发 展 的 影响 ,在 时 
间 序 列 上 移动 一 步 (1 年 ) 进 行 “ 修 匀 ”。 通 过 多 个 检索 
主题 与 关键 词 的 跨 平台 组 合 (CNKI 和 WANFANG DA- 
TA) ,以 及 移动 平滑 的 时 间 窗 口 划 分 ,可 以 在 突出 知识 
单元 与 知识 关联 固有 发 展 规律 的 同时 ,显示 出 “知识 管 
理 " 知 识 群 落 与 “社会 网 络 ”“ 复 杂 网 络 ” 等 知识 群落 在 
时 间 序 列 下 的 交叉 聚合 等 演化 现象 。 
4.2 提取 流程 

首先 ,根据 表 1 中 的 相关 数据 构建 原始 邻接 和 矩阵 
与 原始 网 络 。 分 别 统计 UL 217 时 间 窗 口 下 的 关键 词 在 
文献 中 的 共 现 关系 及 频次 ,并 据 此 建立 各 个 时 间 窗 口 
的 关键 词 多 值 邻接 矩阵 Au -Au 。 根 据 17 个 邻接 和 矩阵， 
基于 关键 词 共 现 关 系 分 别 生 成 17 个 时 间 窗 口 的 领域 
知识 网 络 Cu -Gy。 甚 次 ,根据 常规 的 关联 频 度 法 提取 
知识 网 络 的 结构 关系 信息 。 在 关联 频 度 法 中 , 赣 值 越 
小 ,提取 出 的 知识 网 络 结构 关系 信息 就 越 细腻 。 研 究 
中 ,以 2 TEN TRE BME s ,过 滤 掉 原始 网 络 中 共 现 频次 小 
于 2 的 关联 关系 , 即 剔 除 邻 接 和 矩阵 Au -Au 中 小 于 2 的 
元 素 ,由 此 获得 相应 频 度 水 平 的 知识 网 络 Fu -Faro FF 
次 ,根据 特征 分 解法 提取 原始 网 络 的 结构 关系 信息 。 
对 邻接 矩阵 A, -A 进 行 特 征 分 解 ,以 不 同 组 合 方式 提 
取 和 矩阵 特征 值 ,根据 设 定 的 闵 值 提取 知识 网 络 的 结构 
关系 信息 ,生成 相应 特征 值 下 的 特征 网 络 E, -Euro 
后 ,将 基于 特征 分 解 提 取 的 特征 网 络 (E, -Eu ) 与 原始 
网 络 (Cu -Cu ) 和 关联 频 度 法 提取 的 水 平 网络 (F -Fu ) 
进行 对 比分 析 , 以 验证 特征 分 解法 在 识别 .提取 网 络 主 
要 结构 关系 信息 中 的 功能 与 特性 。 

以 t17 时 间 和 窗口 下 的 知识 网 络 Gu 为 例 。 对 其 邻 
接 矩 阵 Au 进行 特征 分 解 。 邻 接 矩 阵 Awy 共 有 748 个 
征 值 。 将 邻接 矩阵 Au 的 特征 值 由 大 到 小 排序 编 
,以 顺序 号 为 横 轴 ,特征 值 为 纵 轴 ,矩阵 Au 的 748 个 
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特征 值 排列 如 图 2 Bron : 


图 2 邻接 矩阵 AUT 的 特征 值 
从 图 2 可 以 观察 到 ,大 多 数 的 矩阵 特征 值 集中 在 


横 轴 (0 值 ) 附 近 , 只 有 少数 的 特征 值 偏离 横 轴 较 远 
(绝对 值 较 大 ) 。 由 和 矩阵 特征 分 解 的 原理 可 知 ,少量 
的 绝对 值 较 大 的 特征 值 对 应 了 网 络 Gu 中 的 主要 拓 
扑 结构 信息 。 因 此 在 基于 网 络 思维 的 知识 结构 关系 
的 乌 取 中 ,只 需 提 取 这 些 重要 程度 较 高 的 特征 值 ( 绝 
对 信 较 大 的 特征 值 ) ,就 可 以 涵盖 领域 知识 之 间 主 要 
MEM A. 

一 知识 结构 关系 的 提取 过 程 中 ,重点 提取 绝对 值 较 
2 中 偏离 横 轴 较 远 ) 的 序 位 靠近 极 值 的 特征 值 ， 
DEOS 作为 边 的 权重 阔 值 ,提取 原始 知识 网 络 的 结构 
伴 关 ,基于 所 提取 的 结构 信息 组 合生 成 基于 特征 分 解 
的 等 征 知识 网 络 。 提 取 邻 接 和 矩阵 Av 的 最 大 、 次 大 特 
征 德 (序号 为 1.2) 和 最 小 ,次 小 特征 值 (序号 为 747、 


"TU 


748) ,组 合生 成 的 特征 网 络 如 图 3 所 示 : 


图 3 部 分 特征 值 组 合生 成 的 特征 网 络 


结合 图 3 中 的 结果 和 和 抢 阵 Au 中 的 信息 可 以 发 现 ， 
原始 知识 网 络 Gu 的 主要 特征 值 (序号 为 1.2、747、 
748 ) 对 应 的 网 络 拓扑 结构 信息 为 知识 管理 (KM ) 和 社 
会 网 络 (SN) 子 网 ,两 个 知识 群落 之 间 的 结构 关系 在 图 
3 中 得 到 清晰 地 呈现 。 经 验证 ,单独 提取 某 一 特征 值 
所 得 到 的 子 网 络 中 的 节点 与 边 均 来 自 于 原始 知识 网 络 
cu 的 节点 集合 N 和 边 集合 Li;。 这 与 数据 采集 内 容 
和 采集 方案 是 相符 合 的 ,说 明 特 征 分 解法 能 够 识别 知 
识 网 络 中 的 主要 结构 关系 信息 。 由 此 ,可 以 根据 研究 
需要 决定 所 要 提取 的 特征 值 组 合 。 
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5.1 静态 网 络 结构 关系 提取 

在 特征 分 解法 中 ,确定 了 需要 提取 的 特征 值 组 合 ， 
则 确定 了 被 提取 出 来 的 相关 网 络 的 结构 关系 信息 。 而 
边 的 权重 阐 值 则 决定 了 最 终 从 原始 网 络 中 提取 出 的 子 
网 的 规模 。 以 t17 时 间 窗 口 为 例 ,对 Au 进行 特征 分 
解 ,提取 第 1 - 11 和 第 738 -748 共 22 个 绝对 值 较 大 
的 特征 值 , 边 的 权重 羡 值 分 别 设 定 为 0.5、1.0、1.1 和 
1.2。 基 于 这 22 个 特征 值 的 网 络 结构 关系 信息 ,分 别 
组 合 构建 不 同 边 权 重 阔 值 下 的 特征 网 络 ,并 与 原始 知 
识 网 络 Gu 和 关联 频 度 法 提取 的 水 平 网 络 Fu 对 比 ,所 
得 结果 如 图 4 所 示 。 图 4 中 的 网 络 采 用 T. M. J. 
Fruchterman 和 E. M. Reingold" Jiu m E-R 布局 算 
法 ,由 自主 研发 的 网 络 可 视 化 程序 绘制 。 


pn 


注 :KM -知识 管理 ,SN - 社会 网 络 ,CN - 复杂 网 络 ,SNA - 


社会 网 络 分 析 ,KG - 知识 图 谱 ,IS -情报 学 ,图 书馆 
图 4 原始 网 络 与 特征 网 络 和 水 平 网 络 


图 4 中 ,(a) 为 原始 知识 网 络 Cu ,(b) X BE = 
0.5 的 特征 网 络 ,(e) 为 闵 值 =1.0 的 特征 网 络 , (4) 为 
国 值 =1.1 的 特征 网 络 ,(e) 为 阔 值 =1.2 的 特征 网 络 ， 
(为 水 平 知识 网 络 Fu。 同时 ,基于 特征 分 解法 ,生成 
特征 网 络 Eu 与 原始 网 络 cy 和 水 平 网 络 Pu 的 基本 统 


计 特 征 ,如 表 2 Bron : 
表 2 网 络 统计 特征 
网 络 点 数 边 数 ”密度 RRRA 特征 路 径 长 度 
原始 网 络 Cu7 748 2054 0.0074 0.1664 3.3612 


特征 网 络 Euy pfi -0.5 591 930 0.0053 0.0743 3.1906 
阔 值 =1.0 147 183 0.0171 0.0262 3.1083 
Bjff-1.1 56 68 
Bi -1.2 51 | 60 0.0471 


0.0442 0.0800 3. 8617 


0.0750 4. 3388 


水 平 网 络 Fu7 51 57 0.0447 


0.0610 2. 6267 


结合 图 4 和 表 2 中 的 相关 数据 可 以 发 现 ,在 特征 
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值 越 低 ,特征 网 络 就 越 接 近 原 始 网 络 Cu, ;权重 阔 值 越 
高 ,特征 网 络 在 保留 原始 网 络 主要 结构 特征 的 情况 下 
就 越 精简 。 在 本 实例 中 , 当 边 的 权重 阔 值 取 1.2 时 ,所 
获得 的 特征 网 络 的 节点 数 和 边 数 近似 于 关联 频 度 闵 值 
-2 时 的 水 平 网 络 Fu 。 然 而 图 4 中 (e) 为 连通 网 络 ， 
(1) 为 非 连 通 网 络 。 显 然 ,特征 网 络 更 倾向 于 保留 呈现 
网 络 的 主要 结构 关系 ,而 水 平 网 络 则 侧重 于 网 络 节点 
间 关联 频 度 的 统计 显著 性 。 特 征 网 络 的 这 一 特点 在 领 
域 知识 发 展演 化 的 动态 网 络 分 析 中 ,将 有 助 于 知识 关 
联 关系 生长 或 衰退 的 呈现 与 揭示 。 

此 外 ,特征 分 解法 中 的 边 权重 闵 值 既 可 以 取 整 数 ， 
也 可 以 取 小 数 ,在 取 值 的 选择 上 要 远 远 丰富 于 关联 频 
斋 潜 。 关 联 频 度 法 中 , 频 度 阔 值 可 选 定 的 最 小 值 为 整 
数 过 说 明 最 小 只 能 以 阔 值 = 2 的 水 平 从 原始 网 络 中 提 
联 俏 息 ( 频 度 阔 值 越 小 从 原始 网 络 中 提取 到 的 信息 越 
书 鲁 ) 。 特 征 分 解法 通过 灵活 组 合 设 定 特征 值 和 阔 值 ， 
不 高 限 于 固定 阔 值 ,能够 自由 提取 .缩放 原始 网 络 中 的 
整体 或 局 部 拓扑 结构 特征 。 
5O 结构 关系 动态 演化 揭示 
QJ 通过 提取 绝对 值 较 大 的 特征 值 ,能 够 识别 出 原始 
知 阴 网 络 中 的 主要 结构 关系 信息 。 由 知识 网 络 的 静态 
水 尝 可 以 发 现 ,相同 边 权重 条 件 下 ,知识 管理 (KM) , 社 
会 网 络 (SN) 和 复杂 网 络 ( CN ) 等 子 网 的 规模 相对 较 
数据 采集 方案 相符 合 。 另 一 方面 ,知识 关联 关系 
全 现 能 够 影响 知识 网 络 拓扑 结构 的 演化 “!。 因 此 ， 
进 富 步 采用 特征 分 解法 提取 1999 -2017 年 间 原 始 知 
MUR (Gu -Gu ) 中 知识 管理 ,社会 网 络 和 复杂 网 络 对 
应 的 特征 值 ,组 合生 成 时 间 序列 特征 网 络 (E, -Eu ) o 
重点 对 网 络 中 3 个 知识 群落 的 交叉 关联 状态 进行 跟 
踪 , 并 与 基于 关联 频 度 法 得 到 的 时 间 序 列 水 平 知识 网 
络 (Fu F a) 进行 比较 分 析 。 

以 特征 分 解法 来 提取 17 个 时 间 窗 口 下 的 原始 网 
络 的 结构 关系 信息 。 首 先 ,从 17 个 时 间 窗口 的 邻接 矩 
阵 中 提取 与 知识 管理 ,社会 网 络 和 复杂 网 络 相关 的 特 
征 值 。 然 后 ,以 0.5 作为 权重 阔 值 ,在 17 个 时 间 窗口 
下 分 别提 取 原始 知识 网 络 的 相关 特征 值 组 合生 成 相应 
的 特征 网 络 。 同 样 采用 F-R 布局 算法 , Bad fit - 0.5 
的 时 间 序 列 特征 网 络 如 图 5 所 示 。 

图 5 中 的 时 间 序 列 特征 网 络 显示 ,在 时 间 轴 的 初 
台阶 段 (U 0) ,考察 对 象 中 的 社会 网 络 (SN ) 与 知识 管 
理 (KM) 知识 群落 之 间 尚 未 连通 ,处 于 各 自发 展 阶段 。 
此 时 复杂 网 络 (CN) 相关 知识 尚未 在 考察 对 象 中 出 现 。 


S 阅 值 =0.5 的 时 间 序 列 特征 网 络 


£O 时 间 窗 口 ,知识 管理 与 社会 网 络 知识 群落 之 间 首 
次 连通 。t4 时 间 窗 口中 ,复杂 网 络 知识 群落 首次 出 现 ， 
但 与 知识 管理 和 社会 网 络 知识 群落 之 间 处 于 非 连 通 状 
态 。6 时 间 窗 口中 ,上 一 时 间 窗 口 处 于 连通 状态 的 知 
识 管理 与 社会 网 络 知识 群落 之 间 再 次 断 开 ,此 时 3 个 
知识 群落 之 间 互 不 连通 。t6 时 间 窗 口中 ,社会 网 络 和 
复杂 网 络 知识 群落 分 别 与 知识 管理 知识 群落 连通 , 即 
社会 网 络 与 复杂 网 络 只 有 通过 知识 管理 才能 建立 联 
Z. Ma 时 间 窗 口 开 始 , 社 会 网 络 .复杂 网 络 .知识 管 
理 3 个 知识 群落 通过 多 个 知识 节点 或 其 他 小 规模 群落 
始终 保持 相互 连通 状态 。 在 后 续 的 时 间 窗 口中 ,社会 
网 络 .复杂 网 络 .知识 管理 3 个 知识 节点 较 稳 定 地 形成 
了 网 络 中 由 桥 点 (bridge) 相互 连通 (或 直接 关联 ) 的 峰 
点 (peak) ™ ,三 者 之 间 的 关联 关系 得 到 清晰 地 呈现 。 
为 了 对 特征 分 解法 在 不 同 边 权重 下 的 提取 效果 有 
更 清晰 地 认识 ,研究 中 进一步 以 1.0 为 边 权 重 冰 值 , 生 
成 特征 网 络 , 见 图 6。 
图 6 中 所 提取 的 特征 值 与 图 5 相同 ,不 同 之 处 在 
于 边 权重 阔 值 取 值 为 1.0, 据 此 组 合生 成 时 间 序 列 特 
征 网 络 。 将 图 6 与 图 5 对 比分 析 可 以 发 现 ,由 于 边 权 
重 的 提高 ,一些 低 于 阐 值 的 边 被 舍弃 ,相应 产生 的 孤立 
节点 被 排除 。 由 此 导致 3 个 知识 群落 的 规模 相应 地 减 
小 ,一 些 在 低 权 重 贱 值 下 可 见 的 结构 关系 也 相应 地 隐 
JER, UH (3 14,16 0 18 09. 等 时 间 窗 口 。 尽 管 如 此 ,图 6 
对 知识 管理 .社会 网 络 和 复杂 网 络 知识 群落 之 间 结 构 关 
系 的 揭示 总 体 上 与 图 5 一 致 ,在 时 间 序 列 的 后 期 形成 较 
为 鲜明 的 由 桥 点 相互 连通 (或 直接 关联 ) 的 3 个 峰 点 。 
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处 于 非 连 通 状 态 。 在 时 间 轴 的 后 半 段 ,t10、t12.t13、 
t15 t16 时 间 窗 口中 复杂 n em 
与 知识 管理 知识 群落 建立 联系 ;tll 时 间 窗 口 知 识 管 

与 社会 网 络 连 通 ,复杂 网 络 与 两 者 非 连通 ;t17 ids 
口 社 会 网 络 与 复杂 网 络 连 通 , 知 识 管理 与 两 者 非 连通 ; 
仅 有 tl4 时 间 窗 口 呈现 出 特征 分 解法 中 时 间 轴 后 半 段 
表现 显著 的 3 个 峰 点 通过 桥 点 相互 连通 (或 直接 关联 ) 
的 现象 。 
事实 上 ,知识 的 交叉 融合 现象 是 知识 发 展 过 程 中 
的 普遍 规律 。 自 20 世纪 末 网 络 科学 复兴 以 来 ,网 络 分 
析 作 为 一 种 新 的 研究 范式 已 经 被 引入 到 知识 管理 研究 
的 诸多 方面 ,社会 网 络 、 复 杂 网 络 与 知识 管理 在 研究 工 
作 中 的 交叉 结合 已 经 见 诸 于 众多 文献 。 在 基于 特征 分 
v- 图 6 阅 值 =1.0 的 时 间 序 列 特征 网 络 解法 提取 的 结构 关系 组 合生 成 的 特征 网 络 中 ,能 够 观 
Gn 于 对 比 验证 的 目的 ,进一步 根据 一 般 的 关联 频 。 察 到 社会 网 络 , 复 杂 网 络 和 知识 管理 3 个 知识 群落 之 
"e 从 原始 知识 网 络 G, put omes 点 关系 闻 的 交叉 关联 的 具体 形成 过 程 。 关 联 频 度 法 在 边 的 权 


fa. 以 2.0 作为 关联 频 度 阔 值 ， dedica 重 设 定 上 只 考虑 节点 之 间 的 关联 频 度 ,没有 考虑 网 络 
XE nct 点 对 ,并 生成 关联 频 度 在 2.0 这 整体 拓扑 结构 属性 ,不 能 识别 频次 低 于 冰 值 但 在 整体 
DET. EBACERHA F, F, MBIT HO 拓扑 结构 中 处 于 相对 较 重 要 位 置 的 边 的 信息 (具体 表 
现 为 图 7 中 多 个 时 间 窗 口 的 非 连 通 及 “ 峰 点 ” 间 桥 接 关 
系 丢 失 现 象 ) 。 因 此 ,在 由 满足 频 度 阀 值 的 边 ( 节 点 
对 ) 生 成 的 水 平 网 络 中 ,知识 网 络 演化 过 程 中 的 低频 次 
的 重要 关联 关系 将 会 丢失 。 
5.3 ”特征 分 解法 与 pathfinder 算法 对 比 

在 分 析 了 特征 分 解法 与 关联 频 度 法 差异 的 基础 
上 ,进一步 将 特征 分 解法 与 男 外 一 种 基于 路 径 的 简化 
网 络 算法 Pathfinder 算法 进行 对 比分 析 。 首 先 ,根据 
Pathfinder EJE X} t2 t7 ,002 和 17 时 间 窗 口 下 的 知识 
网 络 进 行 简化 。 将 参数 q 设 定 为 n-l , 即 考虑 节点 之 间 
的 所 有 真实 存在 的 路 径 。 分 别 将 参数 了 设 定 为 1 和 无 
穷 大 (Inf) ,观察 在 不 同 的 参数 r 的 作用 下 ,Pathfinder 
算法 对 网 络 的 精简 效果 。 

表 3 Pathfinder 子 网 ( PFNETs) 统计 特征 


图 7 阅 值 =2.0 的 时 间 序 列 水 平 网 络 


t2 Uu ti2 u7 
关联 频 度 法 中 的 关联 频 度 阔 值 为 2.0 意味 着 除了 MARE Ca ni a E A E ER 
Ie 04e C4 FOIE HE A LR 1.0) Z PIN IARA 202 546 DS 209 S9 2482 748 2054 


值 , 所 生成 的 水 平 网 络 最 接近 原始 网 络 。 由 此 生成 的 PFNETs ro] 202 526 725 2029 839 2429 748 2044 
水 平 网 络 ( 见 图 7) 的 分 支 结 构 ( 非 连通 碎片 ) 明 显 多 于 r- Inf 202 500 725 1938 839 2323 748 1997 
特征 分 解法 生成 的 特征 网 络 ( 见 图 5、 图 6)。 在 图 7 的 Pathfinder 算法 在 简化 网 络 的 过 程 中 会 至 少 保留 
所 有 时 间 窗 口中 ,关联 频 度 法 生成 的 水 平 网 络 都 存在 。 ”一 条 原本 连接 两 个 节点 的 路 径 , 因此 不 会 破坏 网 络 原 
非 连通 的 碎片 ,说 明 一 些 重要 的 结构 关系 被 关联 频 度 。” 本 的 连通 性 ,提取 得 到 的 子 网 络 PFNETs 的 节点 数量 
阅 值 拒绝 。 时 间 轴 的 前 半 有 段 (t1 -9) ,知识 管理 .社会 网 ”与 原 网 络 保持 一 致 ,节点 规模 没有 精简 。 从 边 的 数量 
络 和 复杂 网 络 3 个 知识 群落 之 间 始 终 未 能 建立 联系 ， 上 看 , 子 网 络 PFNETs 对 于 网 络 的 简化 程度 也 低 于 特 
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征 分 解法 和 关联 频 度 法 。Pathfinder 算法 适合 用 来 解 
决 关 于 网 络 主要 路 径 的 一 些 问 题 。 在 网 络 拓扑 结构 信 
息 的 识别 与 提取 上 ,特征 分 解法 的 灵活 之 处 还 在 于 可 
以 通过 选取 特征 值 组 合 和 设 定 阐 值 ,自由 地 决定 所 要 
提取 的 网 络 成 份 及 规模 ,这 是 Pathfinder 算法 无 法 实现 
的 。 


本 文 提出 一 种 基于 邻接 矩阵 的 特征 分 解 提取 知识 
网 络 结构 关系 的 方法 。 研 究 中 通过 所 提取 的 特征 值 组 
合生 成 特征 网 络 , 并 分 别 从 静态 分 析 和 动态 分 析 两 个 
方面 ,对 特征 分 解法 和 关联 频 度 法 进行 了 比较 分 析 。 
分 析 结 果 表明 ,基于 特征 分 解法 的 知识 网 络 结构 关系 
提取 具有 如 下 特性 。 
写 (1) 特 征 分 解法 能 够 识别 知识 网 络 中 的 主要 成 分 
售 咏 。 从 知识 网 络 提取 结构 关系 信息 ,原则 上 要 在 考 
虚 刚 识 网 络 的 整体 拓扑 结构 性 质 的 前 提 下 ,判断 网 络 
酒 节 点 与 边 的 重要 程度 , 别 除 重要 性 相对 较 低 的 边 。 
以 往 根据 节点 出 现 的 频次 或 节点 对 关联 频 度 设 定 阔 值 
担 陨 网 络 结构 关系 信息 的 数据 处 理 方法 ,是 根据 微观 
属 研 知识 单元 或 知识 关联 的 局 部 信息 来 判定 宏观 层面 
的 侨 域 知识 的 整体 属性 , 其 正确 性 和 有 效 性 均 不 能 满 
感 汶 局 网 络 结构 关系 呈现 的 需要 。 这 两 种 传统 方法 忽 
略 子 网 络 的 拓扑 结构 性 质 ,一 定 程度 上 偏离 了 网 络 科 
尝 感 维 的 初 圳 ,有 可 能 导致 研究 者 错失 网 络 的 重要 结 


GOD 特征 分 解法 能 够 准确 识别 低频 次 的 但 对 网 络 
整体 拓扑 结构 较为 重要 的 关联 关系 ,对 知识 之 间 的 结 
构 关系 比较 敏感 。 在 领域 知识 生长 发 展 的 进程 中 ,新 
知识 的 加 入 和 新 关系 的 建立 都 需要 经 历 由 弱 到 强 的 过 
程 。 网 络 整体 结构 的 改变 往往 来 自 于 细小 变化 的 反复 
普 加 ,因此 低频 次 的 关联 关系 也 可 能 对 领域 知识 网 
络 拓扑 结构 的 改变 起 到 至 关 重 要 的 作用 。 特 征 分 解法 
保留 了 拓扑 层面 上 的 重要 路 径 ,完好 地 呈现 了 社会 网 
络 .复杂 网 络 和 知识 管理 3 个 通过 桥 点 相互 连通 (或 直 
接 关联 ) 的 峰 点 ( 见 图 5 图 6) ;关联 频 度 法 则 明显 拒绝 
了 复杂 网 络 与 知识 管理 之 间 的 低频 度 关联 ( 见 图 7) 。 
显然 ,单纯 对 关联 频 度 的 关注 会 一 定 程度 地 降低 网 络 
拓扑 层面 关键 细节 的 呈现 ,而 特征 分 解法 能 够 在 所 提 
取 的 网 络 中 观察 到 指定 特征 值 对 应 的 节点 之 间 交叉 关 
联 的 细微 过 程 。 因 此 ,特征 分 解法 对 于 知识 单元 或 知 
识 群落 之 间 的 交叉 关联 更 为 敏感 ,对 研究 知识 之 间 的 


动态 演化 机 制 更 有 帮助 。 

(3) 特征 分 解法 能 够 灵活 自由 地 提取 知识 网 络 结 
构 关 系 信息 。 关 联 频 度 法 以 知识 单元 之 间 关 联 的 频次 
作为 判定 知识 单元 之 间 的 关联 关系 的 重要 程度 的 依 
据 。 特 征 分 解法 在 知识 单元 关联 关系 的 权重 与 阔 值 的 
设 定 问题 上 ,综合 考虑 了 网 络 的 整体 拓扑 结构 性 质 和 
局 部 的 节点 之 间 的 关联 关系 , 较 关 联 频 度 法 更 为 优秀 。 
此 外 ,特征 分 解法 通过 矩阵 特征 值 的 选择 , 既 能 够 借助 
绝对 值 较 高 的 特征 值 生成 反映 原始 网 络 拓扑 结构 的 特 
征 网 络 , 也 能 够 针对 研究 重点 选取 指定 特征 值 生成 研 
究 者 需要 的 特征 网 络 。 这 一 特点 使 得 基于 特征 分 解法 
提取 知识 网 络 结构 关系 信息 具备 灵活 自由 的 特点 , 既 
可 以 用 于 对 知识 网 络 整体 拓扑 结构 的 判 识 , 也 可 以 对 
特定 知识 关联 的 细微 变化 进行 研判 。 
虽然 特征 分 解法 能 够 准确 识别 和 提取 知识 网 络 中 
特定 的 信息 ,但 相对 于 传统 的 网 络 数据 处 理 方法 ,其 实 
现 过 程 较为 复杂 。 在 后 续 的 研究 中 ,将 继续 思考 特征 
分 解法 在 知识 网 络 研究 领域 的 应 用 模式 ,进一步 规范 、 
简化 特征 分 解法 的 具体 步骤 。 同 时 ,在 对 邻接 矩阵 进 
行 特征 分 解 的 过 程 中 初步 发 现 , 相 对 于 抢 阵 的 主要 特 
征 值 , 绝 对 值 较 小 的 特征 值 所 对 应 的 网 络 拓扑 结构 也 
在 一 定 程 度 上 影响 着 知识 网 络 的 统计 特征 。 对 于 这 些 
绝对 值 较 小 的 特征 值 在 知识 网 络 中 的 指 代 意 义 的 探索 


也 是 接 下 来 的 研究 工作 。 
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Structural Relationships Extraction of Knowledge Networks 
Based on Eigen Decomposition 
Luan Yu Teng Guangqing An Ning Han Shangxuan 
School of Information Science and Technology, Northeast Normal University , Changchun 130117 

Abstract. | Purpose/significance | The effective identification and extraction of structural relationships in knowl- 
edge networks helps to detect the topology of knowledge networks and their evolution patterns from a wide range of data. 
[| Method/ process | This article proposes a method for extracting structural relationships in knowledge networks based on 
eigen decomposition of adjacency matrix. Using the real data, the eigen decomposition method and traditional correlation 
frequency method are compared and analyzed from static structural relationships extraction and dynamic structure evolu- 
tion, and compared with the pathfinder algorithm. The validity of structural relationships extraction of knowledge networks 
based on eigen decomposition method is verified. [ Result/conclusion] The research results show; the eigen decomposi- 
tion method can identify the main component information in the original knowledge networks, the method can accurately i- 
dentify the low frequency correlations that are important to the global topology of the networks, and the extraction method 
is flexible and free. 
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